胡 凌:论地方立法中公共数据开放的法律性质 ||《地方立法研究》
论地方立法中公共数据开放的法律性质
作 者:胡 凌(上海财经大学法学院副教授、副院长)
来 源:《地方立法研究》2019年第3期,因篇幅过长,已略去原文注释。
理解公共数据的法律性质,至少可以从三个维度进行讨论,一是将公共数据开放视为现有政府信息公开制度的自然延伸,并在具体机制上对接扩展,由此它是一种政府法律义务而非单纯的公共服务;二是基于财产理论,将公共数据视为类似于自然资源的公共信息资源,纳入国有资产管理框架,它需要保值增值;三是在前者基础上衍生出公共信托法律关系,政府在符合公共利益的原则下以适当的方式对公共数据进行开发和开放,使全社会受惠于这一过程。本文将论证,上述理论在特定方面是有道理的,但都无法单独说明公共数据开放的正当性,在执行过程中也受到相关制度的约束。公共数据是一种信息资源,在权属上应当为全民共同所有,但在价值实现机制上由作为数据控制者的政府进行收集、归集、共享和开放,将公共数据按照不同类型区别使用,并在实践过程中不断优化使用方式,扩展可供使用的公共资源的范围和程度。
关键词:政府信息公开 公共数据 开放 平台型政府 国家数据能力
◆ 引言
◆ 一、作为国家财产的公共数据
◆ 二、从财产规则到责任规则
◆ 三、平台型政府与国家数据能力
◆ 结语
引言
(一)问题的提出
自2011年《开放政府宣言》发表以来,越来越多的国家(或城市)陆续加入这一行列,允许公众免费自由地获取本地公共数据,满足知情权和创新的需求。近年来,我国在实践上也开始推动政务数据开放,从形式上看正在与世界接轨;但从数字政府形态的演进看,数据开放过程有其自身演进的逻辑,并成为平台政府的一种重要服务。我国开放数据运动的初衷在于更好地利用公共数据资源,通过信息技术提升公共服务水平和质量,这一初衷实际上在之前电子政府建设和建造“智慧城市”的动议中就产生了。通过电子政府建设,国家从自建信息公开网站到依托互联网企业平台提供公共服务;通过智慧城市建设,城市管理者们以政府采购方式加强基础设施投入,主要的做法是将智慧城市的信息基础设施建设外包给私人公司,特别是互联网公司。从这个意义上说,公共数据开放更多地被嫁接在打造统一电子政务平台的逻辑上展开。
尽管部分地方政府相继出台公共数据共享与开放的规范或政策,但总体而言对于数据开放的理论基础尚未达成共识,由此造成公共数据的法律定位不明晰、相关制度设计与实践简单化等问题。就学术研究而言,关于公共数据开放的法学研究不多,大量文献集中于公共管理领域;而法学研究更集中于私人信息/数据资源池的权属问题,较少涉及公共数据相关法律问题。随着公共数据开放越来越成为国家的重要政策和实践,有必要进一步在理论上探讨这一开放行为的法律性质及其与整个公共数据立法体系的关联,并以此观察相关地方立法实践。
理解公共数据开放的法律性质,至少可以从三个维度进行讨论:一是将公共数据开放视为现有政府信息公开制度的自然延伸,并在具体机制上对接扩展,由此是一种政府法律义务而非单纯的公共服务;二是基于财产理论,将公共数据视为类似于自然资源的公共信息资源,纳入国有资产管理框架,它需要保值增值;三是在前者基础上衍生出公共信托法律关系,政府在符合公共利益的原则下以适当的方式对公共数据进行开发和开放,使全社会受惠于这一过程。本文将论证,上述理论在特定方面是有道理的,但都无法单独说明公共数据开放的正当性,在执行过程中也受到相关制度的约束。公共数据是一种信息资源,在权属上应当为全民共同所有,但在价值实现机制上由作为数据控制者的平台政府进行收集、归集、共享和开放,将公共数据按照不同类型区别使用,并在实践过程中不断优化使用方式,扩展可供使用的公共资源的范围和程度。公共数据当前的法律定位应当是财产规则和责任规则的混合体,对相当一部分的公共数据而言,应当保持不断开放,以事后使用的责任规则进行约束,以便社会主体有能力持续地获取和访问公共数据资源,同时增强政府作为数据控制者的认证与追踪能力。
本文所称的公共数据,在概念上至少包括三个层次:①政府或具有准公共职能的机构在行使有明确授权的公共职能的过程中自行获取的数据;②政府部门委托授权特定私营部门或个体行使特定公共职能过程中收集的数据;③在具有公共属性的领域或空间中,并非通过政府授权职责产生的但涉及公共利益的数据。其中①和②属于狭义层面的公共数据,即涵盖了确定的“政务数据”,其基础是得到授权的行政行为;但③本身的范围是更加开放的,涵盖了各类主体在公共空间中不断产生的非私人化数据,在一定情况下需要政府立法推动和规范使用方式,确保公共利益得到维护,在条件允许时可以通过授权开发,通过政府向社会集中提供和管理。本文更多地讨论前两个层次。
本文不试图在规范意义上建构一套公共数据的法律权利,而是希望通过对这类权利性质的讨论,进一步推进理解数据资源的特殊性和平台型政府对数据法律性质可能的意义。本文从“政府信息公开”作为公共数据开放的制度基础开始,讨论其现实困境,并重点讨论公共数据开放的另一个理论基础——“财产权利”,进而在第二部分从实践视角分析数据资源池的法律属性更接近于责任规则,即在立法上只需明确数据控制者的相关权责,但没有必要以纯粹财产权利的方式对数据池的集合性权利进行规定;第三部分进一步讨论如何提升事后追踪数据使用的国家数据能力,这涉及政府作为新型平台的架构设计与一系列数据采集、归集、分析的实践,以此为我们理解平台型政府提供了新的视角。
(二)从政府信息公开到公共数据开放
笔者先讨论公共数据开放的第一种常见的理论基础。从制度设计上说,公共数据开放首先依托于既有的政府信息公开制度,是政府信息公开的自然延伸。政府信息公开制度源于为了保障社会公众对政府行为和公共事务的知情权,一定程度上确保公共信息得以无障碍流通和使用,给予社会主体以稳定的预期和监督能力。信息的数量并非这一制度关心的问题,相反,这一制度侧重于信息中蕴含的内容本身,即通过分析和使用这些信息使大众更好地理解公共事务,对未来事务形成稳定预期,并在一定程度上限制政府权力。因此,“公开”意味着任何社会主体都可以不受限制地(如设置密码和访问权限)以技术上合理的方式获取信息并予以使用,尽管信息的载体(如计算机系统)可能受到相关法律的保护,但获取公开信息行为本身并不会直接带来损害后果。
公共数据开放实际上是政府信息公开的必然结果。随着信息收集和发布的成本降低,当可公开的政府信息积累到一定量的时候,数量本身就具有了重要意义,形成了表面上形态不同的东西,即数据集;其使用方式也脱离了简单的信息阅读与理解,通过对大量数据集进行机器分析产生新的价值,甚至和其他数据放在一起挖掘形成新价值。从这个意义上说,数据开放是依托开放互联网进行的政府信息公开升级版本,信息使用的方式得到进一步升级,政策目标也从满足简单的知情权(单条信息)转向通过公共数据开发产生价值(数据集)。尽管如此,数据在概念上仍然可以被解释为结构化的单条信息集合,在原理上仍然适用于传统的政府信息公开,并按照既有信息公开的程序进行收集、整理和发布。将公共数据开放制度嫁接在政府信息公开制度上面,在理论上是融贯的,为数据公开合法性提供了坚实的理论基础,不需要新的独特制度设计,因此有研究者主张在政府信息立法中涵盖数据开放,作为一种独特类型予以规定。
实际上,通过比较现有的政府信息公开制度和地方政府的公共数据开放制度,也能发现两者具有相当程度的一致性,即在内容和程序上进行有效对接。尽管在政策目标上有所分离:其一,两者在概念上都指行政机关在履行职责过程中制作或者获取的,以一定形式记录、保存的信息/数据。关于公共数据的法律定义,地方立法中主要有两种方式,一种为概括式,如《上海市公共数据和一网通办管理办法》规定,“本办法所称公共数据,是指本市各级行政机关以及履行公共管理和服务职能的事业单位(以下统称公共管理和服务机构)在依法履职过程中,采集和产生的各类数据资源”。又如《福建省政务数据管理办法》规定,“本办法所称政务数据是指国家机关、事业单位、社会团体或者其他依法经授权、受委托的具有公共管理职能的组织和公共服务企业(以下统称数据生产应用单位)在履行职责过程中采集和获取的或者通过特许经营、购买服务等方式开展信息化建设和应用所产生的数据”。另一种为列举式,如《成都市公共数据管理应用规定》,“本规定所称公共数据,是指政务部门在依法履职过程中产生和管理的,以一定形式记录、保存的文字、数据、图像、音频、视频等各类信息资源”。而且,公共数据的主要生产者和控制者不仅在于各级行政机关,也延伸到履行公共管理和服务职能的事业单位,并规定了遵照和参照执行的主体,从而扩大了数据开放的范围。其二,都强调通过此类制度加强政府信息资源的规范化、标准化、信息化管理,加强政府平台建设,推进与政务服务平台融合。公共数据开放在地方立法中往往与公共数据的收集、归集和内部共享乃至与“一网通办”结合在一起,通过数据开放的形式有效整合内部资源。其三,在具体操作中都设置了针对不予公开或开放的信息/数据的制度性评估和认定,即具有国家秘密、商业秘密、个人隐私以及法律规定的不予公开的内容(如三安全一稳定),因此,对数据开放的种类和边界仍然可以在现有信息公开的基础上进行深化,在标准上不需要有特别的变化。通过制度上的对接,有助于将静态的公开信息不断变成动态的数据提供给社会公众,产生单条信息无法产生的巨大价值。
尽管有上述理论基础和程序制度上的衔接可能性,现实中的实践仍然没有按照这一逻辑展开。首先,从立法上看,2019年新修订的《政府信息公开条例》没有增加有关数据开放的任何内容,只是在既有制度基础上进行了细化和完善。其部分原因是,在多大程度上需要将公共数据与政府信息打通尚未达成共识,而且就全国范围来说数据开放也尚未成为广为接受的制度性实践。这也意味着,在未来可预见的若干年中,不太可能在全国范围内将公共数据开放纳入政府信息公开制度,实践中势必加强分离力度。其次,2019年新修订的《政府信息公开条例》明确规定了政府信息“以公开为常态,不公开为例外”的原则,这使得信息公开本身成为政府的一项基本职能和责任;但对于数据开放而言并非如此,目前尚没有地方立法明确规定公共数据也要以开放为原则、不开放为例外,因为这会给相关部门施加过大的压力。由于立法的不明确,导致相当多的地方政府仅仅将其视为一种可以逐渐改善的服务而非法定职责,加之缺乏内在动力和激励使之改进,并担心可能的数据公开之后的风险(如马赛克效应),会将更多数据归为有条件开放或不予开放的类别。处理信息公开的部门也会因为数据开放的工作量压力较大而反对将后者纳入统一制度进行认定和管理,因此在制度上无法有效落实。最后,政府主动公开的信息在总量上有限,更多的信息则是依申请公开,以便满足大众的知情权。这与数据开放分属不同层次,数据开放更多地侧重于能够为机器所阅读和分析,以便开发出新价值,提升公共数据的质量,进而带动整个公共服务的水平。如果数据公开的侧重点在于提升公共服务的水平,政府就需要重新理解信息时代大众的需求,甚至提供更加个性化的服务,并依赖于政府各部门之间数据库的互通有无,这对于政府而言仍然需要长时间的推动。但由于政府各部门之间缺乏动力进行协作,交由私人公司进行打通和挖掘就是一个次优的选择,同时也会带来丧失发展数据能力主导权的风险。
这些原因共同导致了公共数据开放的地方性实践仅仅依赖于国家统一的政策性指令,缺乏稳定的理论和制度基础,即公共数据开放无法以在先的政府信息公开制度证明其正当性。如果数据开放不能依赖信息自由和社会公共知情权理论,我们就需要寻找其他理论基础证明这一开放过程的社会价值,即笔者要重点讨论的第二种较为流行的理论——财产理论。
一
作为国家财产的公共数据
(一)财产理论的起源
数据开放理论需要回答为什么特定种类的数据需要被开放给大众,以及是否与这一种类数据的性质有关。一般而言,数据权利的正当性来自两个维度,一个维度是数据来源于特定主体的活动,由此记录了其活动的内容,是这一活动的副产品,那么组织其活动进行的劳动投入就成了获取这些活动收益的重要动力。例如,私人互联网平台通过投入对市场交易活动进行匹配和组织,进而通过用户协议获得对这些数据的占有权和排他使用权;并通过账户对用户进行持续地追踪,否则获得的数据将是不完整的,也无法更好地进行大数据预测。因此,这一维度集中于数据的控制、生产与分配。另一维度则是数据反映的对象,即相关数据对象的特定权益是否应当被尊重,例如,国家秘密、商业秘密和个人隐私需要得到一定程度的保护。在这一前提下,我们还需要考虑单条信息和数据集合在价值上的不同内涵,只有成为数据集而非单条信息,才有更强烈的动力对该种数据资源进行确认和主张权利。
如果将数据资源首先视为一种集合性资源,就意味着需要对集合性资源的某种数据权利进行确认。在当前的社会语境中,特别是承认大数据重要性的前提下,这似乎是不言而喻的,即单条的信息即使有价值也极为有限,而集合性数据不仅能够传播得更远,通过元数据分析也能够获得无法事先设想到的社会价值,其本质上是通过数据对未来产生影响和予以预测。同时,对单条信息或搜集的纯粹个人信息的过度强调与保护或授予绝对财产权,都可能产生个体不予授权或谈判成本高昂的情形,结果是数据无法有效地汇集在一起产生集体性价值,在经济学上被称为“反公地悲剧”(tragedy of anti-commons)。因此,无论是公共数据还是私人数据,对数据集合相关权利进行确认,并平衡其他相关权益,都是合理的数据政策中较为核心的问题。
这种集合性数据权利在理论上可以有三种区分。第一种是,将汇集大量数据的集合在法律上抽象为“数据池”(data pool),并赋予数据收集和管理者以排他地使用和收益的权利。尽管《民法总则》并未明确规定数据池的财产权,但大量不正当竞争的案件,都通过保护数据控制者架构的方式间接确认了特定平台企业对其提供的服务信息(无论是否公开)。这种方式在功能上起到了划清数据池权利边界的作用,即承认平台企业可通过用户协议合法收集和使用用户信息的财产性权利,尽管其使用需要遵循一定规则。这种理论的基础主要体现在三个方面:其一,通过合同约定的方式合法获得用户数据使用权。用户协议多为格式合同,用户需同意平台企业收集和使用其数据的行为,无法拒绝。其二,关系理论。这一理论认为,用户的网络行为产生于用户和服务提供者之间的服务关系,因此对于其行为数据和隐私,双方均有权利获取和使用,企业为了生产经营和改善用户服务的需要可以对用户数据进行收集分析,这已经成为通行的市场行为。其三,劳动理论。这一理论认为,平台企业对更加有效地获取分析用户数据进行了大量投入,付出了更多劳动,因此有权获得基于数据产生的财产权利。这三种思路目前仍然支配着研究者和法院的思维方式。这种理论的直接后果是,事实上保护了平台企业的私人财产权和财产性投入,并基于大量数据产生出更多价值,但同时排斥了其他竞争对手和更多开发者对这些数据的使用,也忽视了这些数据同时也源自大量用户提供的劳动。换言之,数据财产权利的边界划分仅仅在组织社会生产的意义上有价值,但尚未涉及分配领域。
第二种理论是“信托理论”。这一理论不承认数据池作为一种排他性的私人财产权利,而认为数据池应当为全体互联网服务的用户所有,为了产生集体性的价值,并最终回馈用户,可以在法律上承认一种信托关系,即互联网平台作为对其搜集到的数据池的信托人,对全体用户负责,在获取一定收益的同时,承担更多的安全保护义务和社会责任。尽管这种理论只是停留在学术研究层面,但在现实中具有一定的解释力,例如,包括我国《网络安全法》在内的相关规则都在不断加强平台对用户个人信息的保护,也有研究者将其解释为一种平台企业对用户的信义义务。实际上,从公共信托理论的角度理解政府对公共数据承担的有效管理与利用职责,能够帮我们更好地理解如何管理和使用公共数据资源。但这一理论的困境在于,目前在我国,信义义务更多存在于公司法领域,其他公共资源领域尚未落实为有效的制度设计,因此也难以进行比拟。
从上述两种理论中还可以推演出第三种思路:功利主义理论,即从社会福利最大化的目标出发对某种资源进行充分利用,将数据资源视为有价值的资产加以合理地规划和利用。特别是公共数据资源可以向社会开放,增加社会的整体福利。毫无疑问,公共数据产生于政府/公共部门行使行政职权的过程中,可以认为狭义的公共数据属于一种公共数据资源,并可以通过政府统一管理,有序开放利用,增加社会价值。如下文将要介绍的那样,相当多的地方性立法已经采用了这一思路。
(二)公共数据的财产维度
综上,关于公共数据法律属性的思考可以有几个层面,既涉及与现有公共资源的类比,也涉及数据本身的自然属性。
首先,数据产生于人类的活动过程,是对人类活动依据一定指标得到的数据化的反映,其准确程度依赖于对活动变化的捕捉和涵盖,从这个意义上说,数据是人类活动的副产品,其原初属性取决和依附于该活动的实施者。例如,个人信息/数据主要反映了个体生活的主要状况,在法律上主要以人格权价值加以保护;企业或政府等组织的数据产生于这些组织的活动,其权益也更多地由这些组织获取。因此,由于公共数据产生于得到授权的政府公务活动,其行为本身代表了公共利益,其产生的数据本身也可以依托这一过程形成公共数据资源,政府理所当然成为公共数据资源的排他控制者,并可以根据公共利益的需要授权使用。在这一意义上,很多研究认为公共数据可以被定性为公共资源,并比照我国现有关于公共资源的管理方式进行讨论。
其次,数据和知识产权类似,属于一种无形资产,具有可以低成本复制传播的特点和优势,但依赖于一定载体和技术手段加以分析和展示。汇集大量数据的数据集合在传统知识产权法上被赋予数据库权利,简而言之,数据库是按照特定的顺序或方法排列,并具有相互联系的数据信息的集合,著作权法对数据库保护的是对其内容的选择或者编排体现独创性的表达,而不是它所选择或编排的内容本身。但在实际中,服务器上承载的大量数据和信息的界限早已超出了汇编作品的范畴,成为数据池,因此需要法律赋予其集合性财产权利。
这就决定了数据公共资源与其他物理性的公共资源的占有和使用方式的不同。对于传统的物理性公共资源,无法实现多人共同开发,只能采取诸如通过特许经营的方式对公共资源进行开发、利用和交易,并将获得的收益上缴国库,最终实现全民共享。这主要涉及工程建设项目招标投标、土地使用权和矿业权出让、国有产权交易、政府采购等多个方面。其主要思路是,由地方政府主导建立公共资源交易市场,收益权与执法权合一,拍卖授权私人使用公共资源,未来的趋势是国务院推动全国范围内公共资源交易平台的整合,保持信息的流动和整合。但数据资源有所不同。
最后,与物理资源相比,数据资源的特点是:①非消耗性、复制成本低、传播范围广,可以多重增值、二次加工,即因为数据的更新或变更而产生新型数据产品或产生新的价值。②这种价值的产生对数据的总量和质量要求较高。③数据可以同时授权多主体开发使用,使开发规模和可获得的社会收益成倍增长。④数据交易或开放的实质是数据开发和使用权授权,而非所有权转移,即数据控制者与使用者身份不能混同。⑤在开放过程中存在信息安全隐患,不仅可能涉及对计算机系统的安全影响,也会涉及数据中承载的多种数据主体利益的冲突和滥用。
从这个意义上说,数据作为公共资源进行开发具有一定的特殊性,其规则和原则都具有不同的特点,主要体现为:其一,公共数据开放不仅有利于公共利益增值,也有利于私人利益增值。传统的公共资源开发强调公共利益,而且主要体现在分配环节,即开发公共资源的收益进入国库;但数据开放作为一种集体开发方式,其价值更多地体现在生产环节,而且开发主体可以更直接地从开发过程中获益。其二,公共数据资源开发程序较为简易,只需要开放特定公共数据平台接口即可,交易成本低廉,但产生的价值很高。其三,新问题可能体现在,目前政府作为数据控制者,尚未建立有效机制追踪和控制数据的流向与使用、对特定数据使用者的身份进行认证,以及对数据使用效果进行跟踪反馈。
我国一些地方性立法将公共数据资源纳入类似的公共资源或国有资产体系管理,或推动数据交易所实践,试图在实施机制上予以理顺。例如,《福建省政务数据管理办法》规定:“坚持政务数据资源属于国家所有,纳入资产管理的理念,遵循统筹管理、充分利用、鼓励开发、安全可控的原则;明确政务数据资源统筹管理机构;通过建设统一的政务数据汇聚共享平台,实现数据的集中管理和统一交换;推动政务数据向社会开放共享,增强数据的公共服务能力,实现数据资产增值。”这一规定和政府信息公开的逻辑完全不同,强化了政府在实现公共数据价值中的主导作用。其制度优势在于,将数据资源管理按照成熟的国有资产管理制度来管理,可以有效防止数据资源的滥用或闲置。比如,将数据资源交易和使用类比工程建设项目招标投标、土地使用权和矿业权出让、国有产权交易和政府采购等制度。其遵循的思路是由地方政府主导建立交易市场,将收益权与执法权合一,通过拍卖授权私人使用公共资源,即对物理资源的所有权与使用权分离。数据资源也可以排他授权给特定企业进行开发挖掘,产生稳定的可预期收益,也可以对风险和管理成本进行一定程度的控制。
但这一模式也存在一定问题。其一,在地方有限的立法权限下,很难直接将公共数据进行如此定性,其界定权限必定属于中央政府,地方出台相关法规无疑是对地方立法权的突破,除非有授权试点,否则在法律上存在一定障碍。其二,如果将公共数据资源定性为国家财产,地方政府势必要承担对该种资产进行保值增值的责任,从而有动力将公共数据资源按照传统自然资源授权使用的模式以政府采购方式进行排他授权。但这种做法与基于信息公开的数据开放价值相悖,即过度强调信息公开的资产属性而非社会属性。在无法对社会公众如何使用数据进行追踪评估的前提下,排他性授权自然是最优选择,这种实践已经十分普遍。其三,如果以这种方式进行公共数据开发,无疑将开放问题转变成公共资源使用权拍卖问题,最终逻辑可能是将整个公共服务外包,从而使该项服务失去了公共属性,而完全偏向营利性。
在实践中,因为成本和技术手段原因,大量公共数据的收集与开发,包括智慧城市建设与信息系统整合,都需要外包委托给商业公司完成。这就涉及政府采购行为以及商业公司相关的权利义务分配。实践中有相当多的案例表明,由于行政机关对数据的采集和使用把控不严,导致受委托企业利用这一采集地位优先使用该数据,从而获得不正当竞争优势,对基于开放公共数据开发的正常市场竞争秩序造成了不良影响。例如,2017年在谷米诉元光案中,法院针对数据抓取不正当竞争的判决揭示了关于公共数据利用的困境。
对于公共信息资源而言,其最大的不同点在于数据信息可以无限复制,只要有一个高效运转的垄断性平台,大量中小开发者即可在平台上进行开发,产生的价值呈级数增长,也避免了招标投标带来的麻烦,公共数据池的所有权和使用权也能够产生分离。但问题再次回到,究竟应当由政府主导兴建开发者平台,还是由私人互联网企业主导兴建平台,以及如何真正使数据开发有利于公共利益。综上,单纯的数据池财产理论容易形成理解和操作上的偏差,很难成为公共数据开放的坚实理论基础。
二
从财产规则到责任规则
(一)公共数据池和私人数据池的关系
如前所述,在数据池权利需要得到确认的前提下,至少有两种不同性质的数据资源池:公共和私人。私人资源池完全由私人平台企业或单位组织主导,其特征是封闭和排他,尽管法律没有直接承认私人财产权利,但往往通过间接的方式确认了私人企业作为数据控制者对数据的排他占有、使用和收益的权利。首先,在一些围绕数据展开的不正当竞争案件中,法院确认了未经许可进入平台企业架构抓取数据行为的不正当性,即不论数据实际权属如何,但如果违反在先权利(如合同权利),或者入侵信息系统的架构,或者以不正当的方式使用抓取的内容,那么这种抓取和使用就违反了不正当竞争法,从而间接地确认了平台企业对数据池的财产权利。其次,关于入侵计算机系统,刑法很早通过非法入侵计算机系统罪等一系列保护计算机系统的罪名对此类行为进行调整,以至于在实践中,存在大量直接通过公安机关立案侦查被提起公诉的不正当竞争案件,结果凸显了强化刑法威慑的特征(某种意义上也是对不正当竞争判决判罚数额较低的一个补充替代)。再次,即使法律尚未规定对数据的权利,平台企业开始拓展新型思路,转而要求法院确认通过对大量数据进行分析得到的数据产品的排他财产权。最后,为了使大量数据得到有效开发,平台企业往往会通过开放API(应用程序编程接口),允许第三方开发者接入平台开发数据,或者通过账号登录第三方平台进行数据交换的方式,从而变相地使数据一定程度上得到流动共享,但效果始终受限于企业本身的利益诉求。
和私人数据池相比,公共数据池的特点在于,通过政府平台将大量数据公共资源向社会共享,而非垄断在自己手中。这不仅是政府信息公开的进一步要求,也是增强整个社会数据能力的重要举措。例如,《上海市公共数据和一网通办管理办法》将公共数据按照开放类型分为无条件开放、有条件开放和非开放三类。涉及商业秘密、个人隐私,或者法律、法规规定不得开放的,列入非开放类;对数据安全和处理能力要求较高、时效性较强或者需要持续获取的公共数据,列入有条件开放类;其他公共数据列入无条件开放类。
数据本身的开放特性表明,功利主义财产理论似乎能够成为公共数据开放的理论基础,即开放有利于社会整体福利,但这一道理对私人数据资源池也依然成立(即社会总福利一般而言会超过单个企业因丧失竞争优势而产生的损失,并有利于更多创新)。功利主义无法说明,单纯就数字资产而言,向更多开发者或社会公众开放,必然会使社会价值呈级数增长(开源软件的社会后果已经充分证明了这一点),但这与私人企业主张的作为排他财产性竞争利益的数据池权益相悖。如果是否开放完全取决于公共信托财产的管理者,那么,从保值增值的角度考虑,就不会对大量数据进行广泛的开放,势必又会回到某种封闭资源池或者有限开放模式,这都和公共数据开放的初衷背道而驰。
因此可以看到,简单的财产理论仍然存在着难以解释为何需要在全社会进行大规模数据开放的困境,即公共数据似乎并不天然地应当与全社会共享,有必要探索更有解释力的法律理论基础。进一步的问题则是,在多大程度上政府能够保持公共数据平台的活力,不仅要提供不断更新的数据,更主要的是对数据流通回社会进行追踪和反馈,推动更多元数据和衍生数据在社会主体之间共享,从而进一步了解数据的流动和使用状况,提升数据质量。
(二)数据池的责任规则模式
无论是公共还是私人,数据资源池的法律地位始终难以通过财产权利模式彻底解决。如前所述,数据池权利的最大特点是使用而非占有,对数据池的访问和使用是最为核心的两个权利。从数据池本身能够创造的社会价值看,选择退出(opt-out)规则对整体社会效益更为合适,即数据控制者无法事先知道何种使用数据的方式最佳,可以让第三方以低成本进行挖掘,如果发现有问题(如侵犯隐私、危害竞争秩序)再停止使用,以便最大限度地开发,这更多的是一种责任规则。而一旦采取严格审核,决定谁有能力进行开发,将数据池看作一种需要选择加入(opt-in)的资源池,那就变成了财产规则。
数据权究竟应当是一种财产规则还是责任规则?从生产关系角度看,答案是不一样的。首先,从网络服务提供者之间的关系看,拥有海量数据的平台企业更倾向于将数据权看作一种防止未经授权而访问(access)和获取的财产规则,这在大量约束爬虫行为的司法规范中得到了体现。在当前的司法实践中,互联网企业往往以不正当竞争方式要求法院保护私人数据,尽管法院多认定数据池是一种竞争性权益,但并未明确企业对数据池的绝对财产权利,而是更多地通过保护物理的信息系统或架构来间接保护数据池权利。从这个意义上说,企业要求数据财产权用以对抗其他竞争对手,并减少互联网的公开性所可能带来的麻烦。财产规则更能够保护作为一个整体的数据控制者利益群体,尤其有利于大型平台企业,它们希望提升责任标准,进而获得规则红利。例如,它们会要求将访问数据池的权利扩展到追踪对数据的使用方式,或者要求法律确认数据产品的财产权利,否则就无法控制开放互联网下的传播和使用。因此,财产理论势必限制开放数据的使用,不仅开放过程和权限都可以通过技术手段限制,表面上公开的信息也可以通过账号授权的方式限制访问或者获取,从而切断了信息公开和数据开放的关联。其次,从平台和用户之间的关系看,平台企业要求一种相反的规则类型,即责任规则。对于用户而言,他们无法脱离平台企业控制的生产性的架构,因此,在已经实际控制数据池的前提下,平台企业要求数据池权利成为以形式上的同意为基础的责任规则,即用户可以选择退出,但平台企业有权事先收集用户数据进行分析使用。
上文指出,如果仅仅将数据池看作国有资产,以财产规则确立其法律地位,并不解决社会共享和非金钱性使用的问题;这一逻辑无法促进大众创造,因为官僚系统为了满足保值增值需求势必会寻找以金钱性使用效益最大化的企业进行合作,担心任何可能的风险,结果反而影响了正常的市场竞争和社会共同受益的机会。因此,有必要将此类高质量资产限制在最小范围内,采用财产规则;而将大量数据开放,采用责任规则方式。公共数据池的法律属性势必是一种混合的法律模式,即没有必要在需要高度流动性的使用数据的前提下通过财产权利约束数据池,而是鼓励数据控制者不断扩大数据开放的范围和程度,让更多的开发者和社会公众能够参与其中,并事后对可能的侵权责任进行救济。
(三)从公共数据归集到公开的法律结构
从数据价值和权责的分配看,至少可以区分数据生产者、数据控制者、数据对象和数据使用者四类不同的利益诉求。其一,数据生产者是指通过劳动、技术或任何可见的投入直接产生数据的主体,这一主体可以是政府部门及其工作人员,也可以是得到授权的非政府主体,他们通过政府采购等协议获取一定程度的报酬,但并不占有和使用数据。其二,数据控制者是指在法律上有权对数据资产进行占有处分的主体,特定政府部门是公共数据的当然控制者。在收集到归集公共数据的过程中,这一概念还可以进一步细化。例如,在收集过程中,不同政府部门是各自部门公共数据的控制者,一旦由统一平台进行归集后,数据控制者转变为统一平台的数据中心。其三,数据使用者是指有权对数据资源进行合法使用的主体,政府主体自身不仅可以开发数据,也可以通过信息公开或数据开放的形式授权不特定第三方使用该数据,数据使用者可以从开发中获取收益。其四,数据对象指数据资源内容所涉及的社会主体,可以单独或综合识别出其身份。例如,通过个人信息可以识别出特定的个人身份,通过商业秘密可以识别出特定的企业,因为政务活动涉及大量社会主体,公共数据被匿名性处理之前也会影响特定数据对象的权益,如隐私、商业秘密、国家秘密等。在数据资源使用过程中不可避免地涉及数据对象的权益,需要在不同场景下仔细区分。
公共数据开放在本质上是一种权限较大的授权使用,因此在形式上需要完善的使用协议,如果不能通过技术手段和商业模式进行约束,至少可以通过合同方式明确开发者的权利义务。目前各国政府越来越依赖许可协议的规制作用,将其视为评估政府数据开放程度的重要指标。而我国的政府数据开放平台极少配有授权许可协议,这是我国政府数据开放制度设计的缺陷,有必要进行研究。范佳佳的研究提出了我国政府数据开放许可协议(Chinese License for Open Government Data,CLOD),该协议主要用于实现开放数据平台的增强能力,对公共数据的流向与使用进行进一步追踪和管理。协议中政府部门的责任包括:全面开放、保障数据质量,促进利用、释放数据价值,风险管理、保护数据安全。政府部门的权利包括:数据控制权、管理权,数据收益权,数据利用知情权,数据豁免开放权,免责权。用户的主要权利包括:数据开放请求权,合法利用数据,获取收益。主要责任包括:保护数据安全,不滥用数据。
政府数据公开涉及大量的数据审查行为,难免会存在复杂的审核程序,进而影响正常的数据利用。特别是与国外政府信息相比,我国更加看重政府信息对国家秘密、商业秘密和个人信息以及社会公共安全的影响,偏重风险防范模式。这就为政府部门主动开放数据的动力造成了一定影响。为避免这种影响,特别有必要对开放数据中政府的免责进行规定,即因为政府审核错漏导致可能不利后果的,或者因为公开数据与其他数据混合分析产生的“马赛克效应”,或者因公共数据完整性和原始性问题提出的异议。政府作为数据许可人和控制者,一般而言需要免责。因此,有必要在使用许可协议中规定:其一,相关政府部门不保证在任何特定目的下使用任何公共数据集的完整性、准确性、内容或适用性,以及所提供公共数据集中隐含的各类推断。其二,对于任何特定用途或使用任何公共数据集,或者利用任何第三方提供的数据集,相关部门对其完整性、准确性或适用性方面的任何不足不承担责任。其三,相关部门将对多源头数据叠加产生的马赛克效应导致的商业机密和个人隐私泄露风险定期进行评估和数据修订,任何机构或个人不得向其要求承担马赛克效应产生的法律责任。但对仅因为直接发布的数据造成社会主体信赖利益受损,或者给社会主体带来直接损失的,应当按照过错程度承担行政责任或民事责任。
三
平台型政府与国家数据能力
(一)作为数字平台的政府
上文的讨论实际上都指向了一种新型的政府和公共服务形态:平台政府。这种形态的政府是在我国智慧城市的建设过程中逐渐出现的,在表现形式上,以电子政务为基础的“一网通办”为外在形态,在内部汇集各类政务资源和信息,并根据既定标准对外公开。其运作的核心模式是,统一在一个服务界面提供全部的电子商务服务,并不断在整个公共空间中通过传感器、摄像头等方式采集公共行为数据,以唯一的数字身份进行认证,并通过社会信用评分等以柔性方式对公民行为进行约束和管理,从而最终将整个物理公共空间在架构上转化为赛博公共空间。当越来越多的公共数据被通过行政行为收集、归集和共享时,政府提供的公共服务才更加需要通过数据挖掘并提供更加多元和精准的服务。从这个意义上说,数据开放的程度和水平与公共服务内在架构的流程化、透明化息息相关,也意味着政府对公共数据使用和掌控能力的提升。如果没有有效的前端数据收集与归集,数据开放就会产生混乱。
首先,公共数据的采集一般包含如下几个类型:①行政行为过程所必然涉及的行政行为相对人的基本数据,以及该行为过程本身的数据,例如公共安全摄像、交通安全摄像等;②行政行为过程所涉及的非社会主体数据,例如交通、气候等;③依法专门采集社会主体基础信息数据库,并进行核准。合法采集之后将汇总到统一的大数据中心进行进一步清理。
其次,公共数据共享的首要机制是一数一源、一源多用,不得重复采集。这意味着不同行政行为所涉及的共同的公民和企业法人数据,只需要采集一次即可。这里的相关数据可以分为两种,一种是进入基础数据库的基础信息资源,一种则是场景化的因人而异的具体数据。两类信息都可以供不同部门共享,但需要符合法定要求。凡属于共享平台可以获取的信息,各政务部门原则上不得要求自然人、法人或其他组织重复提交。人口信息、法人单位信息、自然资源和空间地理信息、电子证照信息等基础信息资源的基础信息项,是政务部门履行职责的共同需要,必须依据整合共建原则,通过在各级共享平台上集中建设或通过接入共享平台实现基础数据统筹管理、及时更新,在部门间实现无条件共享。基础信息资源的业务信息项可按照分散和集中相结合的方式来建设,通过各级共享平台予以共享。基础信息资源目录由基础信息资源库的牵头建设部门负责编制并维护。这种共享不需要经由行政相对人同意,但需要在处理其事务时通过信息展示、核对等方式告知其基础数据正在当下这一特定的行政行为场景下处理,因此不需要重复采集。此类信息由一个部门采集之后归入基础信息数据库,其他部门如需使用直接调取该数据库并进行访问即可。
然而,对于场景化的因人而异的具体数据,也可能成为另一项行政行为的前置数据,例如,为获得某种行政审批,需要调用该相对人此前的奖惩记录。传统而言,此类信息由相对人自己提供,一旦可以后台调取,只需要当事人核对即可。因此在权限操作设计上,有权限调取特定种类数据库的部门务必事先在法律上需要得到该种数据的授权,才可以有权限操作,否则可能会造成混乱。在自动化行政过程中,当事人相关信息应当可以自动调取,并通过审核、签名等方式确认此次调取的合法性。在一些情况下,调取需要告知当事人,但并非以相对人同意为前提,因为这是按照法律的要求进行的自动化调取,相对人只需要通过数字签名确认即可。
只有通过平台型政府这一概念才能使我们更好地思考和理解公共数据开放的定位。例如,开放的目标是为了更多的社会主体可以获得这些数据的使用权,只有加强对数据开放使用过程的跟踪和评估,才能更好地以实现公共利益为导向,如提供更加精准合理的公共服务。单纯的数据开放并不能自动实现公共利益,这涉及国家数据能力的问题。
(二)国家数据能力的演进与挑战
对政府治理而言,在信息时代如何利用大量积累起来的公共服务信息,发现新价值,是政府治理水平提升的必经阶段。对于公共数据的利用,目前至少有四类模式:①通过政府采购由技术公司帮助开发利用某一部门的数据,以互联网商业模式加以运营,这偏重于传统电子政府;②通过政府采购由技术公司帮助打通政府内部不同部门数据库,并负责运营;③通过政府定向采购将公共数据排他地开放给某一家企业独家使用;④逐步向全社会开放各类非敏感数据,依托社会力量开展挖掘,使数据得到更有效的利用。
在四类模式的演化过程中,表面来看数据开放推动了社会大众创新,但有一个潜在的风险是关于国家数据能力的外包。数据能力是国家信息基础能力的一部分,包含了国家作为公共管理者搜集、储存与分析的能力。这在前互联网时代主要体现为国家对社会生活诸多方面信息的搜集与统计能力。国家不仅要有专门的部门负责社会生活重要方面的基础数据的搜集与分析,而且更要建立起一种权威的自主性。在20世纪末信息技术引入我国之初,这种自主性借助诸如金字工程这类实践,奠定了现代化征税、海关系统的基础。随后的网络舆情检测系统在各级地方政府的设立使用,是另一个强化国家调控能力的例子。
按照数据能力的视角,理解数据开放运动可以从政治逻辑和商业逻辑两方面解读。从政治逻辑来看,数据开放是“政府+互联网”,作为公共服务的提供者,政府有责任确定何种数据可以开放给第三方开发者,其目的不是简单地数据外包,而是在外包的过程中把握信息系统和数据库建设的主导权,避免公共数据资源的误用和滥用。而在商业逻辑看来,数据开放则是“互联网+政府”,政府没有能力处理海量的公共信息,还不如交给私人平台处理,他们更有效率。互联网的兴起本质上是将散落在各处(私人、企业、政府)的数据资源整合汇总在一起,形成一个由私人主导的公共资源池,开发出单一数据无法具有的集体性价值,政府积累下来的海量数据自然也在其试图整合的范围内,因为按照大数据开发的原理,数据越多,可能形成的未预料到的价值就越大。“互联网+政府”的含义便是政府活动和公共服务被纳入私人建设的平台,一定程度上可能会失去自主性。受困于服务能力提升的各级政府一旦乐于将繁冗复杂的数据库建设与公共服务外包,将出现按照商业逻辑运营和使用这类数据的大量实践,国家/政府的数据能力将让位于私人服务的数据能力。两个逻辑的根本冲突在于,谁是数字时代公共服务的提供者,将按照何种逻辑提供和产生价值,以及谁能够控制大数据的搜集和使用。这就是为什么国家需要一网通办这样的数字平台提升服务能力和信息处理能力,而不是简单地依赖于技术企业。
目前除了出于国家安全考虑可以对私人数据资源进行监管使用外,私人企业不会把自己的数据主动放到公共池中,只会把公共池里资源放回私人池。现有的数据开放运动是一个公共资源库不断转化为私人资源库的过程,甚至有些企业会以增强创新之名倒逼政府开放更多的数据。目前无法要求企业将开发之后的衍生数据反向向社会开放,但可以通过协议与政府间竞争的方式来逐渐尝试。一个更加激进的建议是,商业数据应当以合理的价格向用户和其他商业数据开放,通过开放数据接口等方式允许其他商业数据在其网内调用其信息、内容、应用及其他网络资源,允许其他商业数据利用指定或自有的开发工具对其进行二次创新开发;个人数据开放应当以本人同意为原则,用户要求支付对价的,应当支付对价,用户对个人数据使用目的和用途提出要求的,应当按照用户要求使用用户个人数据。
在我国语境下,政府数据开放越来越为政府官员接受,无论是出于发展数据经济的初衷,还是出于整合不同部门数据的内在需求。这一主张不仅与政府信息公开一脉相承,更契合新经济对政府掌控的数据资源的期待,在舆论上也逐渐变得不证自明:如果不能及时有效地开放数据与社会共享,就是逆国际潮流而动,从而丧失国家在信息时代的竞争力。此外,论证政府数据开放的另一个正当性是,这将有利于部分公共数据资产的增值,增加社会福利。这一信息资产增值和效率理论的逻辑必然是,与其主张政府开放相关公共数据给社会,为什么不能直接允许私人主体直接自主地采集这些数据并加以利用,这样反而会对这些数据的分析和挖掘变得更加有效率?现有关于政府数据公开的研究无法回答这一设问,因为它们更多地关注政府如何处理收集到的数据,并未将问题延伸到数据的收集环节,这在理论上并不周延。按照这一思路,政府至多只是一个数据中转站,其自身缺乏能力去挖掘价值,有必要向社会公开。它还可能隐含如下推论:政府部门的公共数据最终也需要与私人企业掌握的用户数据结合在一起,才能产生最大限度的价值,否则私人企业不会有经济动力去开发和公共服务相关的数据。
早期的数据开放并不追踪数据的使用及其后果,因此即使出现可能的侵权问题,对其预防也较为困难。第一步便是上文所说的通过数据开放使用协议确定明确的权利义务关系,以至于一旦发生纠纷,政府数据可以尽可能免责,以保证正向的数据开放激励。但更进一步的做法是通过提升政府能力,进一步确立信息资源开放的基本原则和指导意见,政府数据尽可能以开放为原则、以不开放为例外,并提升对数据流动的管理追踪能力。
政府需要进一步强化数据能力和数据意识,不仅需要认清公共服务的本质,也需要理解数字时代公共领域与私人领域的界限。面向大众进行数据公开而非排他地向少数企业提供,是更加公平的做法,这尤其有利于中小开发者直接获取数据,避免了依附于大型平台企业的弊端。这主要是因为,大型平台企业借助入口优势,吸引了大量用户信息,可以将此类信息出售给中小开发者,将他们吸引到私人平台;而政府创建公共信息平台则有利于增强公共平台能力,整合现有分割的数据与服务。
开放公共数据可以让越来越多的普通人参与到数据的提供和管理中,不仅自己提供数据,还要形成挖掘数据的氛围,为公共服务贡献力量。因此下一步不仅要开放数据,还要鼓励对工具开源,鼓励大众创造。这些思路都是要避免发生在公共资源领域的“公地悲剧”效应。公共信息资源如果只是单独地添附至私人平台搜集的私人信息数据中,无助于公共资源本身的增长与增值。有必要明确政府要继续作为此类公共资源的维护者,防止公共资源进一步被私人平台吸纳,成为纯粹的私有物品。从数据的权属问题上看,开放数据确实可以增值,以公共数据吸引私人数据。基于公共数据,诸如在治安、食品安全这样的领域可以进一步鼓励大众上传、分享、应用信息,进而充实公共数据池,形成大众、创业者和政府三者的良性互动机制,以此可以防止“反公地悲剧”。
结语
本文对公共数据开放的法律属性进行了探讨,最后的结论是,和对私人数据池的越来越多的理解一样,没有必要按照物权的方式对公共数据进行立法。最好的方式是允许不同地方政府通过对公共数据性质的不同立法进行比较和竞争,进一步观察何种立法能够推动公共数据的有效流通和利用,使公共利益和私人利益都得到满足。本文的研究发现,原本适用于政府信息公开的诸多制度框架无法继续适用于公共数据开放,这在理论上切断了为后者提供合法性的渠道;而财产理论也无法有效说明公共数据开放的正当性,即以功利主义的社会福利最大化的视角无法适用于可以零边际成本无限复制使用的数据及其价值,从而无法区分公共数据和私人数据;公共信托理论试图对它们进行融合,但在我国语境下难以广为接受。因此,重要的不是在立法上尽快确权,而是探索更加多元化的数据利用方式,既推动数据的流动与挖掘,也推动数据池上不同主体之间的协商与交易。这不仅意味着在数据立法上更多地需要责任规则而非财产规则,即事后对未经授权使用公共数据的后果进行判断,而不是事先通过立法进行成本高昂的保护;也意味着法律需要更多地关注数据权益的分配,而推动流动性可以看作完善分配机制的重要手段。
通过剖析公共数据资源池的法律地位,我们可以探索一个包含公共数据和私人数据的统一数据资源政策,从而探索数据资源的公私合作利用机制,而这一机制需要政府进一步转变职能,成为真正的公共平台。并不意味着只要把数据开放和外包了,社会化服务就能够自动解决一切问题。信息技术正在重塑政府和市场、社会的新边界,有必要在向互联网平台学习的基础上守护公共信息资源,逐步放开行政许可,提升数据能力,以实现真正的信息时代的公共服务。
(责任编辑:徐菁菁)
(公众号学生编辑:蔡梓园)
法规速递